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基于 ALMs 的 实证 分 析 


摘要 :【 目的 ] 以 SCI 高 被 引 论文 为 实证 分 析 对 象 ,通过 分 析 论文 的 引用 频次 与 在 线 使 用 、 分 享 的 相关 性 及 表现 ， 
验证 Altmetrics 指标 在 揭示 优质 文献 方面 的 有 效 性 。[ 方法 】 通过 匹配 DOL 将 高 被 引 论文 的 引文 数据 与 ALMs 
组 合 ,对 论文 的 引用 频次 与 在 线 使 用 、 分 享 数据 进行 Spearman 相关 性 检验 , 并 对 PLOS 系列 期 刊 的 在 线 使 用 与 


分 享 情 况 逐 一 分 析 。[ 结果 】 研 究 表 明 : 引用 次 数 与 论文 的 在 线 分 享 Figshare 呈 弱 正 相关 (r = 0.081, p = 0.01); 与 
CiteULike 标 引 量 呈 中 度 相 关 (r = 0.252, p = 0.01); 与 Mendeley 使 用 量 的 相关 性 最 大 (r = 0.376, p = 0.01)。 部 分 期 
刊 的 Mendeley 使 用 量 在 一 定 程度 上 揭示 了 高 影响 力 文献 。[ 局 限 ] 只 针对 特定 学 科 PLOS 系列 期 刊 , 因此 数据 
的 全 面 性 存在 一 定 的 欠缺 , 得 出 的 结论 能 否 推 而 广 之 , 有 待 于 进一步 研究 。[ 结论 】 论文 的 高 被 引 与 其 对 应 的 在 
线 使 用 与 分 享 的 相关 度 不 高 ， 显 示 出 在 线 使 用 (Mendeley，CiteULike) 与 分 享 (Figshare) 的 数据 在 揭示 高 影响 力 文 


献 方面 存在 一 定 的 不 足 。 
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1 3 引 


引文 是 滞后 的 文献 计量 指标 。 例 如 在 物理 学 领域 ， 
发 表 后 的 文章 一 般 需 要 5 年 才 获得 被 引用 、 被 参考 的 
信息 山 这 样 就 推迟 了 科研 评价 的 进程 ,而 且 , “重要 的 
论文 可 能 被 更 频繁 地 引用 ”， 只 是 基于 一 种 理想 化 的 
假设 , 大 家 对 这 种 文献 计量 即 采用 引文 分 析 用 于 评价 
保持 慎重 态度 王 ]。 虽 然 引 文 分 析 在 当下 仍 不 失 为 一 项 
重要 研究 评估 因素 , 但 是 单 靠 引 文 已 不 能 有 效 衡量 学 
术 交 流 在 各 种 新 层面 的 拓展 : 如 读者 在 线 评论 研究 成 
果 及 与 科研 人 员 在 社交 网 络 互 动 交 流 等 。Altmetrics 的 
广泛 应 用 , 正 逐 渐 凸 显 传统 计量 的 局 限 。 

Altmetrics 可 追踪 任何 形式 发 表 的 研究 成 果 , 超 
越 了 传统 的 文章 的 影响 因子 和 引文 分 析 的 评价 , 填补 
了 一 般 的 引用 评价 指标 时 间 延 迟 的 不 足 , 丰富 完善 了 
科研 评价 体系 ,全面 评价 了 学 术 成 果 的 影响 力 , 包括 


了 中 


通讯 作者 : 


其 学 术 影 响 力 和 社会 影响 力 两 方面 。 

对 科研 人 员 来 说 , Altmetrics 将 大 数据 转换 成 有 用 
的 信息 : 研究 者 可 以 从 中 了 解 针对 科研 所 做 的 推广 与 
努力 , 发 现 其 他 相关 的 科研 同行 , 全球 哪些 地 区 、 哪 些 
研究 者 对 相关 领域 感 兴趣 ,对 相关 的 研究 及 成 果 进 行 
交流 、 互 动 ; 下 次 的 研究 成 果 应 该 发 表 在 哪里 , 才能 获 
得 更 广泛 的 传播 和 认可 ; 以 及 潜在 的 科研 合作 者 的 学 
术 表 现 如 何 。 因 此 , Altmetrics 的 兴起 与 科学 交流 的 社 
交 化 、 网 络 化 密切 相关 。 

对 图 书馆 员 来 说 , 图 书馆 被 行政 主管 部 门 要 求 提 
供 关 于 教师 著作 的 计量 工作 , 日 益 增加 , 现在 教师 申 
报 各 类 各 级 人 才 、 申 请 奖励 等 , 也 需要 提供 重要 创新 
性 论文 被 知名 索引 数据 库 的 收录 、 引 用 证 明文 件 ， 而 
机 构 典 藏 (Institutional Repository, IR) 与 科研 信息 管理 
系统 (Current Research Information System, CRIS), 作 
为 存 取 、 展 示 和 传播 科研 信息 的 工具 , 在 计量 评价 活 
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动 中 扮演 重要 角色 。 许 多 查 新 馆 员 参与 、 讨 论 各 种 科 
学 计量 评价 , 包括 传统 的 收录 、 引 用 , 也 包括 使 用 
Altmetrics, 并且 在 科研 机 构 对 Altmetrics 进行 解说 和 
传播 , Altmetrics 为 图 书馆 提供 了 一 种 新 的 方式 来 表达 
其 存在 价值 由。 

作为 Web 2.0 环境 下 基于 社交 网 络 学 术 交 互 行为 
的 影响 力 计量 方法 , Altmetrics 实时 高 效 追踪 学 术 成 果 
的 传播 精确 计量 各 种 用 户 不 同 的 在 线 交 互 , 测度 学 
术 成 果 的 多 元 化 影响 力 。 论 文 的 收录 引用 情况 固然 在 
一 定 程度 上 可 以 表征 高 影响 力 文献 , Altmetrics 作为 社 
交 网 络 学 术 交 互 行为 的 影响 力 计 量 方法 ， 其 相关 指标 
能 和 否 与 传统 的 引文 分 析 指标 (影响 因子 、 被 引 频次 等 ) 
一 样 , 揭示 高 影响 力 文献 ? 高 被 引文 献 是 否 具有 高 在 
线 使 用 与 分 享 指标 ? 或 者 反 过 来 , 在 线 使 用 与 分 享 指 
标高 的 文献 ， 是否 与 传统 意义 上 高 被 引文 献 一 致 ? 这 
是 本 文 主要 研究 的 三 个 问题 。 

本 文 利用 Altmetrics 数据 集 , 组 配 高 被 引 论文 数 
据 , 选择 其 中 的 在 线 使 用 与 分 享 指标 , 分 析 其 在 整体 
上 和 各 期 刊 层面 的 表现 , 评估 其 在 科学 评价 中 的 有 效 
性 ， 同 时 也 对 高 被 引 论文 的 在 线 使 用 与 分 享 情况 进行 
研究 ,考察 其 能 否 替 代 被 引 频 次 而 成 为 高 影响 力 文献 
的 表征 指标 ， 即 其 能 和 否 揭示 高 影响 力 文献 。 


2 相关 研究 


2.1 Altmetrics 相关 研究 

Altmetrics 研究 始 于 2008 年 , Taraborelli 在 影响 因 
子 作为 主要 评价 指标 被 质疑 后 , 呼吁 建立 一 种 基于 社 
会 软件 的 分 布 式 的 科学 评价 D; 2009 年 , Neylon 和 Wu 
以 PLOS 和 Faculty of 1000 为 例 从 计量 数据 的 来 源 和 
专家 评议 的 激励 机 制 两 个 角度 论述 论文 层面 的 计量 
(Article-Level Metricss，ALMs) 评 价 科学 影响 力 方案 的 
可 行 性 四; 2010 年 7 月 , Priem 和 Hemminger 提出 基于 
社交 网 络 的 科学 计量 学 2.0(Scientometrics 2.0) 概 念 ， 
并 总 结 科 学 计量 学 2.0 研究 的 各 种 类 型 的 学 术 社交 网 
络 数据 资源 ,分 析 基 于 微 博 、 社 会 化 书签 等 Web 2.0 
应 用 提供 的 数据 ,多 角度 地 反映 论文 的 影响 力 中 ,同年 
10 月 , Priem 等 在 Altmetrics.org 发 表 “Altmetrics: A 
Manifesto”， 正 式 提出 Altmetricst 中 。2013 年 ，Galligan 
等 对 Altmetrics 的 内 涵 进 行 前 释 ， 认 为 它 是 评价 学 术 
内 容 影 响 力 的 新 方法 , 并 以 学 术 内 容 在 社交 网 络 ( 如 
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Twitter)、 文献 在 线 管理 工具 (如 Mendeley, CiteULike)、 
分 享 平台 (Figshare) 中 传播 的 广度 作为 评价 的 依据 中。 
Altmetrics 已 有 一 些 具 体 实践 应 用 ,典型 的 包括 : 
Altmetric.com, Impact Story, Plum Analytics 和 和 PLOS 的 
ALMst'"。ALMs 是 多 维 指标 体系 , 包含 引文 数据 、 论 
文 使 用 (在 线 浏览 和 下 载 ) 和 Altmetrics( 社 交 数 据 : 书 
签 和 传播 活动 、 媒 体 和 博客 报道 .社区 讨论 和 评级 )F。 
2.2 ”论文 的 在 线 使 用 与 分 享 研究 

论文 的 在 线 使 用 与 分 享 , 属于 “社交 数据 : 书签 和 
传播 活动 "， 是 学 术 引 用 的 “前 奏 *”， 可 以 即时 测量 出 学 
术 论 文 的 影响 力 ， 从 社会 影响 方面 映射 科学 成 果 ， 是 
Altmetrics 的 重要 指标 。 本 文 从 论文 的 在 线 使 用 与 分 享 
人 和 人手, 对 这 些 Altmetrics 指标 在 科学 评价 中 的 有 效 性 
进行 评估 。 

内 外 对 于 Altmetrics 指标 中 论文 的 在 线 使 用 与 
分 享 的 研究 已 经 展开 。 其 中 ，Ebrahimy 等 考察 了 论文 
的 在 线 使 用 与 分 享 (CiteULike，Mendeley 和 Figshare) 
与 Scopus, Web of Science, PubMed Central 和 CrossRef 
论文 被 引 频 次 之 间 的 相关 性 ,结果 表明 ，CiteULike 和 
Mendeley 与 调查 的 所 有 引文 系统 的 被 引 次 数 具 有 正 
相关 ，Figshare 与 被 引 次数 呈 显著 负 相 关 [0 。 
Bornmann，Haustein 等 ，Li 等 分 别 就 不 同 的 论文 样本 ， 
重点 研究 Twitter， Mendeley 和 CiteULike 与 传统 论文 的 
被 引 次 数 (Scopus，Web of Science) 之 间 的 相关 性 上 -5 
Bornmann 就 F1000 推荐 的 PLOS 期 刊 论文 (1 082 篇 )， 
研究 这 些 具 有 专家 推荐 标签 的 论文 在 Facebook, 
Twitter，Mendeley，Figshare 的 不 同 表现 ， 从 而 验证 
Altmetrics 指标 在 评价 科研 成 果 方 面 的 价值 091, 刘 春 丽 
等 ,由 庆 斌 等 , 宋 丽 萍 等 , 刘 晓 娟 等 ， 金 玮 等 ， 
Mohammadi 等 分 别 就 Mendeley 指标 在 论文 评价 方面 
的 价值 进行 实证 研究 中 1。Shrivastava 等 就 Top 100 
高 被 引物 理论 文 的 引用 次 数 与 Mendeley 读者 数 之 间 
的 相关 性 进行 研究 1, 这 些 研究 主要 就 部 分 Altmetrics 

引 标 验证 了 与 引文 分 析 的 相关 性 与 一 致 性 ,未 就 这 些 
指标 对 高 影响 力 文献 的 揭示 作用 进行 研究 ， 而 本 文 基 
于 ALMs 数据 , 通过 DOI 映射 关系 , 匹配 ALMs 与 高 
被 引 论文 数据 , 构建 SCI 高 被 引 论文 的 Altmetrics 数据 
集 ， 研 究 高 被 引 论 文 在 线 使 用 与 分 享 (Mendeley， 
CiteULike 和 Figshare) 的 情况 ， 从 社会 影响 方面 来 评价 
科研 产 出 ,考察 论文 的 在 线 使 用 与 分 享 数据 在 揭示 高 
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影响 力 文 献 方 面 的 有 效 性 。 

Figshare 是 一 种 在 线 数字 仓储 ， 所 有 文件 根据 
DOI 进行 分 类 存储 。 研 究 者 可 以 保存 和 分 享 研究 成 果 ， 
包括 数据 、 数 据 集 、 图 像 和 影音 等 ， 上 传 和 下 载 
内 容 均 免 费 。 CiteULike 允许 用 户 保存 和 分 享 学 术 论 文 
的 引用 , 是 基于 社会 书签 的 在 线 服 务 , 可 以 促进 研究 
者 之 间 分 享 科研 资料 。 Mendeley 是 免费 的 跨 平台 文献 
管理 软件 , 也 是 在 线 的 学 术 社交 网 络 平台 ， 可 对 文献 
进行 添加 与 组 织 、 阅 读 与 标注 、 与 全 球 同行 协作 、 备 
份 、 同 步 与 移动 、 云 存储 与 发 现 等 。 

在 线 文献 管理 软件 整合 了 社会 书签 和 文献 管理 功 
能 。 因 此 , 本 文 将 CiteULike 标注 量 和 Mendeley 使 用 
量 的 数据 统一 为 在 线 使 用 , 将 Figshare 分 享 量 的 数据 
作为 分 享 数 据 。 


3 ”研究 框架 与 方法 


3.1 ”数据 来 源 与 处 理 

(1) 数据 来 源 与 说 明 

在 Web of Knowledge 网 站 , 选择 Web of Science 
核心 合集 数据 库 ， 基 本 检索 界面 , 设 定论 文 筛选 条 件 
为 2003 年 -2015 年 出 版 的 PLOS 期 刊 论文 ,根据 检 出 
结果 按照 引用 次 数 降序 排列 ， 导出 引用 次 数 三 100 的 
“全 记录 ”数据 到 EndNote, 共 1 939 条 , 然后 将 数据 导 
入 Excel, 仅 保 留 5DOT 和 “引用 次 数 "， 建 立 高 被 引 论 
文 数据 集 , 数据 采集 日 期 为 2015 年 2 月 3 日 。 

笔者 从 Figshare 平台 下 载 ALMs29， 知 识 共 享 协 
议 CC-BY 4.0。 

ALMs 数据 集 (alm_stats 2015-01-10.csv) 包 含 PLOS 
出 版 的 所 有 论文 (142 170 条 记录 , 截至 2015-01-10)。 
此 数据 集 包 括 丰 富 的 论文 级 计量 数据 ， 主要 有 论文 基 
本 信息 : 论文 题名 、 期 刊 名 、 出 版 时 间 、DOL; 使 用 统 
计 ( 数 据 来 自在 PLOS、PubMed 网 站 , 以 COUNTER 3 
记载 的 论文 的 浏览 、 下 载 量 ); 来 自 CrossRef、 PubMed 
和 Scopus 学 术 引 文库 的 论文 被 引 数 据 ; 社会 分 享 
(Facebook，Twitter，Figshare) 、 学 术 性 标注 (Mendeley 
和 CiteULike)、 论文 评论 (PLOS Comments)、 非 学 术 性 
引用 情况 (在 Nature Blogs 指向 单 篇 论文 的 博客 提 及 )、 
文章 报道 和 策划 (Article Coverage 和 Article Coverage 
Curated) 、 学 术 产 出 作者 标识 符 (ORCID) 、 维 基 百 科 
(Wikipedia) 、F1000 因子 (FE1000) 等 1。 
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(2) 数据 处 理 

由 于 ALMs 中 存在 其 与 DOI 的 映射 关系 , 笔者 利 
用 DOI 映射 ,构建 SCI 高 被 引 论文 的 Altmetrics 数据 
集 。 通 过 匹配 和 数据 清洗 , 只 有 DOI(10.1371/journal. 
pmed.0050038) 无 匹配 项 ， 所 以 共 1 938 条 有 效 数 据 。 

根据 DOI 的 不 同 , 将 PLOS Computational Biology 
(PCBD 作 为 期 刊 A, PLOS Clinical Trials (PCTR) 作 为 期 
刊 B， PLOS Genetics (PGEN) 作 为 期 刊 C，PLOS 
Neglected Tropical Diseases (PNTD) 作 为 期 刊 D, PLOS 
ONE (PONE) 作 为 期 刊 E, PLOS Pathogens (PPAT) 作 为 
期 刊 E PLOS Biology (PBIO) 作 为 期 刊 G PLOS 
Medicine (PMED) 作 为 期 刊 H。 这 样 ， 本 文 分 析 的 期 刊 
共 8 种 , 由 于 在 数据 集中 , PLOS Clinical Trials 仅 1 条 
数据 ,数据 量 太 小 , 故 舍弃 ， 只 针对 其 余 7 种 期 刊 进行 
研究 。 
3.2 ”研究 方法 与 应 用 软件 

(1) 研究 方法 

本 文 主要 研究 期 刊 高 被 引 论 文 的 在 线 使 用 
(Mendeley 和 CiteULike) 与 分 享 (Figshare) 三 项 Altmetrics 
指标 与 论文 引用 量 之 间 的 相关 性 , 探讨 传统 科研 评价 
和 学 术 的 社会 影响 力 之 间 的 联系 , 检验 论文 的 在 线 使 
用 与 分 享 能 否 揭示 高 影响 力 文献 。 

1 938 条 数据 涉及 的 论文 集中 在 2003 年 -2014 年 。 
对 三 项 Altmetrics 指标 和 SCI 引用 指标 进行 描述 性 统计 ; 
通过 K-S 单 样本 检验 (定量 ) 和 Q-Q 图 (定性 ), 检查 数据 是 
和 否 符合 正 态 分 布 ; 为 检测 学 术 成 果 科 学 影响 和 社会 影响 
的 关系 , 计算 SCI 引 用 次 数 和 三 项 Altmetrics 指标 之 间 的 
Spearman 相关 性 系数 ; 最 后 , 从 各 期 刊 层面 , 考察 PLOS 
系列 期 刊 论文 在 线 使 用 与 分 享 的 变化 。 

(2) 应 用 软件 

使 用 的 统计 分 析 软 件 为 [BM SPSS Statistics 22.0。 
SPSS 22.0 界面 非常 友好 ,包含 “Statistics Base”、 
“Statistics Regression” 和 “Advanced Statistics” 等 功能 模 
块 , 提供 了 专业 的 “查看 ”"、“ 计 算 ” 和 “预测 ”功能 。 本 文 
中 的 统计 图 表 和 结果 均 由 SPSS 输出 。 


4 研究 过 程 


4.1 SPSS 描述 性 统计 分 析 
由 于 选择 的 SCI 引用 是 引用 次 数 超过 100 次 ， 
此 SCI 引用 数 最 小 值 是 100, 最 大 值 是 2 170。 在 所 有 
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的 文献 数据 中 , Mendeley 使 用 量 、CiteULike 标注 量 和 
Figshare 分 享 量 的 最 小 值 均 为 0， 如 表 1 所 示 : 
表 1 指标 描述 性 统计 


Item Minimum Maximum Mean Std. Deviation 
Mendeley 0 13 015 133.29 318.769 
Figshare 0 167 14.80 12.968 
CiteULike 0 389 5.09 12.020 
SCI 100 2 170 180.66 145.784 
N=1938 


其 中 , 0.62% 的 论文 未 在 Mendeley 上 使 用 , 24.87% 
的 论文 未 在 CiteULike 使 用 ，1.08% 的 论文 没有 在 
Figshare 分 享 ， 如 图 1 所 示 。 即 在 本 研究 构建 的 高 被 引 
论文 数据 集中 , Mendeley 使 用 量 非 零 数据 最 多 。 


Mendeley Figshare CiteULike 
罩 “ 在 线 使 用 与 分 享 量 不 为 零 ” 置 在 线 使 用 与 分 享 量 为 夫 的 
的 论文 比例 论文 比例 


图 1 高 被 引 论文 的 在 线 使 用 与 分 享 统 计 
4.2 数据 的 正 态 分 布 检验 

为 选择 合适 的 相关 性 检验 方法 , 需要 对 本 人 研究 中 
的 SCI 数据 和 论文 的 在 线 使 用 与 分 享 数据 进行 正 态 性 
分 布 检验 。 主 要 选用 定量 分 析 的 单 样本 K-S 检验 和 
Q-Q 图 定性 分 析 来 检验 数据 的 正 态 性 。 

表 2 显示 在 线 使 用 与 分 享 计量 指标 、SCI 引用 的 
双 侧 检验 (P 二 0.05), 拒绝 在 线 使 用 与 分 享 指标 、SCI 
引用 正 态 分 布 的 假设 , 因此 该 数据 不 符合 正 态 分 布 。 

表 2 单 样本 K-S 检验 


Mendeley Figshare CiteULike SCI 


Normal Mean 133.29 14.80 5.09 180.66 
Parameters*” Std. Deviation 318.769 12.968 12.020 145.784 
Absolute .338 .173 .336 .290 

Most Extreme a 
Positive .268 .173 .252 .226 
Differences 

Negative —.338  —.151 一 .336 一 .290 
Test Statistic .338 .173 .336 .290 
Asymp. Sig. (2-tailed) .000° .000° .000° .000° 


( 注 : a. Test distribution is Normal (N=1938); b. Calculated from 
data; c. Lilliefors Significance Correction.) 
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SPSS 的 基本 统计 分 析 功 能 里 可 以 通过 观察 数据 
的 Q-Q 图 判断 数据 是 否 服从 正 态 分 布 。 若 该 组 数据 服 
从 正 态 分 布 , 则 图 中 的 点 应 该 靠近 图 中 直线 , 而且 该 
直线 的 斜率 为 标准 差 , 截 距 为 均值 。 

以 Mendeley 为 例 , 图 2 显示 曲线 与 直线 相交 , 并 
未 接近 重合 , 因此 该 数据 不 符合 正 态 分 布 , 所 以 不 能 
使 用 Pearson 方法 检验 相关 性 。 同样 的 分 析 结 果 , 适用 
于 Figshare, CiteULike 和 SCI 的 数据 检验 。 


Normal Q-Q Plot of Mendeley 
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图 2 各 指标 的 正 态 Q-Q 图 
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4.3 ”相关 性 检验 
笔者 选择 Spearman 相关 系数 进行 SCI 引 用 和 在 线 


使 用 与 分 享 计量 指标 之 间 的 相关 性 检验 , 结果 如 表 3 
所 示 : 


表 3 Spearman 相关 性 检验 


Mendeley Figshare CiteULike SCI 
Correlation Coefficient 1.000 .061™ .596™ .376™ 
Mendeley 
Sig. (2-tailed) i .007 .000 .000 
. Correlation Coefficient .061™ 1.000 .063”™ .081™ 
Figshare . . 
Spearman’s rho Sig. (2-tailed) .007 .006 .000 
N=1938 . . Correlation Coefficient .596™ .063” 1.000 .252™ 
CiteULike i 
Sig. (2-tailed) .000 .006 ; .000 
5 Correlation Coefficient .376™ .081™ 2252” 1.000 
Sig. (2-tailed) .000 .000 .000 


(**: Correlation ls significant at the 0.01 level (2-tailed).) 


SCI 引用 量 和 在 线 使 用 数 与 分 享 数 存在 正 的 弱 相 
关 ，SCI 引用 与 分 享 数 (Figshare) 的 相关 性 很 小 (r = 
0.081, p = 0.01), SCI 引 用 与 CiteULike 标 注 量 的 相关 性 
居中 (r = 0.252, p = 0.01), Mendeley 使 用 量 与 SCI 引用 
之 间 相 关 性 系数 比较 大 (r = 0.376, p = 0.01)。 

矩阵 散 点 图 能 够 可 视 化 地 展示 每 对 变量 之 间 相 关 
性 。 如 图 3 所 示 ，Mendeley 在 线 使 用 和 SCI 引用 具有 
较 高 的 相关 性 。 随 着 Mendeley 在 线 使 用 的 增加 ，SCI 
引用 的 次 数 也 显著 增加 。 也 就 是 说 ， Mendeley 在 线 使 
用 极 有 可 能 导致 未 来 论文 引用 次 数 的 增加 。 从 
Spearman 相关 性 系数 计算 和 和 矩阵 散 点 图 分 析 , 可 以 看 
出 高 被 引 论文 在 线 使 用 与 分 享 的 数据 用 作 科 学 影响 力 
评价 结果 的 一 致 性 。 


Mendeley 


Figshare 


CiteULike 


SCI 


CiteULike SCI 


Mendeley 


Figshare 


图 3 给 阵 散 点 图 
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4.4 ”PLOS 系列 期 刊 论文 在 线 使 用 与 分 享 的 变化 

上 述 关于 论文 在 线 使 用 与 分 享 分 析 以 及 相关 性 检 
验 是 基于 高 被 引 数 据 和 ALMs 的 组 合 数 据 集 ， 即 是 基 
于 PLOS 期 刊 进行 整体 的 分 析 研 究 ， 下面 对 高 被 引 论 
文 所 属 的 期 刊 在 线 使 用 与 分 享 情 况 进行 分 析 。 

从 图 4 宏观 上 可 以 清晰 地 看 出 , Figshare 和 CiteULike 
的 数值 位 于 曲线 底层 , 说明 两 平台 上 积累 的 用 户 数据 
量 太 小 或 者 可 能 用 户 的 活跃 度 太 差 。 根 据 图 4 高 被 引 
论文 所 属 的 期 刊 在 线 使 用 与 分 享 曲线 的 谷 峰 变化 ， 
PLOS 期 刊 基本 上 可 以 分 为 两 类 ,Mendeley 峰值 超过 
SCI 峰值 的 期 刊 群 (A, C, E, H), Mendeley 峰值 低 于 SCI 
峰值 的 期 刊 群 D,F, G)。 对 于 前 者 , 表明 论文 的 在 线 使 
用 量 超过 SCI 引用 次 数 , 未 来 SCI 的 引用 可 能 会 进 一 
步 增加 ; 对 于 后 者 ， 表 明 论 文 的 在 线 使 用 量 低 于 SCI 
引用 次 数 , 论文 的 在 线 使 用 并 未 成 功 揭示 高 影响 力 
文献 。 
4.5 高 被 引 论文 的 在 线 使 用 与 分 享 分 析 

SCI 引 用 次 数 前 10 的 文献 的 在 线 使 用 与 分 享 情况 
如 表 4 所 示 。 从 被 引 次 数 前 10 的 论文 所 属 期 刊 统计 ， 
高 被 引 论文 分 属于 除 A,B 之 外 的 6 种 期 刊 ,其 中 期 刊 
CC 篇 ), 期 刊 DQ 篇 ), 期 刊 EC 篇 ), 期 刊 F( 篇 ), 期 
刊 GC 篇 ), 期刊 H(2 篇 )。 

以 Mendeley 为 例 , 在 线 使 用 前 10 的 文献 的 SCI 
被 引 情 况 如 表 $ 所 示 。 从 Mendeley 在 线 使 用 前 10 的 
论文 所 属 期 刊 统计 , 论文 分 属于 除 A, B 之 外 的 6 种 期 
刊 ， 其 中 期 刊 CC 篇 ), 期 刊 DQ 篇 ), 期 刊 EC 篇 ), 期 
刊 F( 篇 ), 期 刊 G(2 篇 ), 期 刊 HC 篇 )。 从 论文 的 期 刊 
分 布 来 看 , 表 4 和 表 5 的 结果 高 度 一 致 。 
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图 4 各 PLOS 期 刊 (A,C-H) 高 被 引 论文 的 在 线 使 用 与 分 享 的 变化 
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同样 的 分 析 也 适用 于 Figshare 分 享 量 和 CiteULike 


通常 认为 : 0 一 叫 科 0.3 为 微弱 相关 ; 0.3 一 叫 科 0.5 为 
低 度 相关 ; 0.5 二 |r| 志 0.8 为 显著 相关 ; 0.8 二 |t| 志 1 为 高 度 


相关 ， 只 有 当 变 量 之 间 存 在 高 度 相关 时 ,进行 回归 分 
析 寻 求 其 相关 关系 的 具体 形式 才 有 意义 中。 相关 性 检 
验 的 结果 显示 : SCI 引用 量 和 在 线 使 用 数 和 分 享 数 存 
在 正 的 弱 相 关 。Mendeley 使 用 量 与 SCI 引用 之 间 相 关 
性 系数 最 大 (r = 0.376, p = 0.01), 为 低 度 相 关 ; 其 次 为 
SCI 引用 与 CiteULike 标注 量 的 相关 性 系数 ( = 0.252， 
p = 0.01), SCI 引 用 与 分 享 数 (Figshare) 的 相关 性 最 小 (r 
= 0.081, p = 0.01), 为 微弱 相关 。 这 说 明 SCI 引用 次 数 
高 的 论文 , 其 在 线 使 用 与 分 享 的 量 并 不 高 ; 同样 的 ， 
以 Mendeley 使 用 量 为 例 , 在 线 使 用 次 数 高 的 论文 , SCI 
引用 次 数 也 不 高 。 从 PLOS 期 刊 整体 上 看 , 高 被 引 论 
文 与 其 对 应 的 在 线 使 用 与 分 享 的 相关 度 不 高 ， 显 示 出 
在 线 使 用 与 分 享 的 数据 在 揭示 高 影响 力 文献 方面 存在 
一 定 的 不 足 。 似 乎 高 被 引 没 有 带 来 高 的 在 线 使 用 与 分 
享 或 者 是 高 的 在 线 使 用 与 分 享 与 高 被 引 的 相关 性 不 


表 4 SCI 被 引 次 数 前 10 的 论文 及 其 在 线 使 用 与 分 享 量 
Mendeley Figshare CiteULike ”SCI 所属 期 刊 Rankin SCI 标注 量 ,结果 可 能 略 有 不 同 。 
994 35 6 2 170 G 1 Es gk 
264 37 16 2 105 E 2 5 研究 结果 与 讨论 
1130 19 14 2 081 F 3 5.1 研究 结果 
140 14 11 1 814 H 4 
13 015 14 389 1 689 D 5 
608 26 26 1 296 @ 6 
1291 36 8 1 258 E 了 
168 16 2 1191 C | 
1260 23 60 1 132 H 9 
668 23 7 1007 G 10 
表 5 Mendeley 在 线 使 用 前 10 的 论文 及 其 SCI 引用 次 数 
~- Mendeley Figshare CiteULike SCI 所 属 期 刊 a 
Ee Mendeley 
13 015 14 389 1 689 D 1 
1 382 16 29 169 E 2 
1 291 36 8 1 258 E 3 
1 260 23 60 1 132 H 4 
1 239 14 18 641 G 5 
1 150 14 106 172 E 6 
1 130 19 14 2 081 F 7 
1038 14 9 400 F 8 
994 35 6 2 170 G 9 
987 16 10 595 E 10 


SCI 引 用 次 数 最 高 的 论文 , 根据 对 应 的 DOL 发 现 
这 些 论文 的 主题 多 是 关于 科学 研究 的 新 发 现 ， 如 关于 
死亡 率 和 疾病 、 鼠 基因 组 、 微 RNA 靶 标 、 人 大 脑 皮 
层 .DNA 条 形 码 (如 Rank 1, 2, 4, 6, 7, 9, 10 的 论文 ), 但 
是 这 些 论文 的 在 线 使 用 与 分 享 却 非常 低 。 例 外 的 是 
Rank 5( 在 表 5 中 , Rank 1) 的 论文 , 其 SCI 引用 次 数 居 
中 , 但 是 其 Mendeley 使 用 与 CiteULike 标注 量 却 是 最 
高 ， 论 文 是 不 寻常 的 、 令 人 困惑 的 主题 , “调侃 ”大 部 分 
的 科学 发 现 都 是 错误 的 。 

SCI 引用 次 数 最 高 的 论文 ， 其 在 线 使 用 与 分 享 的 
量 并 不 是 最 高 的 , 同样 的 ， 以 Mendeley 使 用 量 为 例 ， 


大 。 这 可 能 与 用 户 在 线 使 用 数据 的 量 不 足 有 关 , 应 该 
持续 关注 该 指标 组 合 ， 待 在 线 使 用 与 分 享 的 用 户 持 续 
增长 ， 能 够 获得 充足 的 用 户 数据 ,继续 研究 其 与 传统 
引文 分 析 评 价 指标 的 关系 。 有 研究 表明 ， 多 数 高 被 引 
研究 者 在 社会 网 络 的 存在 度 不 高 所 ,非常 直接 的 后 果 
可 能 导致 社交 网 络 平台 上 积累 的 用 户 数据 量 太 小 。 
对 高 被 引 论文 所 属 的 期 刊 在 线 使 用 与 分 享 情况 进 
行 分 析 的 结果 显示 : Figshare 和 CiteULike 位 于 曲线 底 
层 , 说 明 两 平台 上 积累 的 用 户 数据 量 太 小 或 者 用 户 的 
活跃 度 太 差 。 根 据 Mendeley 峰值 与 SCI 峰值 的 对 比 ， 
部 分 期 刊 (期 刊 A, C, E, HD 的 Mendeley 使 用 量 揭示 了 
高 影响 力 文献 ,此 外 ,从 使 用 量 高 的 论文 主题 看 , 似乎 
与 科学 人 研究 的 新 发 现 ( 高 影响 力 文献 ) 的 主题 不 相关 ， 


在 线 使 用 次 数 最 高 的 论文 ,SCI 引用 次 数 也 不 是 最 高 
的 。 表 4 和 表 $ 结果 显示 , 两 项 排名 均 在 前 10 的 文献 
有 5 篇 ,引用 次 数 排名 靠 前 的 论文 在 Mendeley 在 线 使 
用 的 量 并 不 多 ，Mendeley 在 线 使 用 排名 靠 前 的 论文 
SCI 被 引 次 数 也 相对 排名 靠 前 。 


区 了 现代 图 书 情报 技术 


可 以 看 出 Mendeley 与 CiteULike 两 平台 除 在 线 文 献 管 
理 功 能 外 ,还 兼 具 社交 功能 。 

在 研究 高 被 引 论文 的 引用 次 数 与 在 线 使 用 与 分 享 
数据 相关 性 时 , 注意 到 CiteULike 标注 量 与 Mendeley 
使 用 量 的 相关 性 最 大 (r = 0.596, p = 0.01)。 很 大 的 可 能 
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性 是 一 篇 重量 级 的 研究 文献 发 表 后 , 很 多 科研 人 员 或 
公众 阅读 ,标注 , 然后 才 有 可 能 进一步 使 用 该 文献 ， 这 
也 符合 科研 的 一 般 流程 。 
5.2 ”研究 不 足 之 处 

(1) 本 研究 的 SCI 引用 数据 采集 自 2015 年 2 月 3 
日 , ALMs 数据 下 载 的 日 期 是 2015 年 1 月 10 日 , 因此 ， 
组 合 数据 集 里 不 包括 2 月 份 ALMs 新 增加 的 指标 数 
据 。 此 外 SCI 收录 各 个 学 科 领 域 高 影响 力 的 期 刊 论 文 ， 
其 引文 范围 有 局 限 性 。PLOS 的 这 些 论文 的 引用 只 是 
被 SCI 收录 的 论文 的 引用 ,如 果 论 文 未 被 SCI 收录 也 
引用 了 PLOS 的 论文 , 则 本 数据 集中 的 引用 数据 并 不 
包括 在 内 。 

(2) 本 研究 针对 特定 学 科 和 特定 期 刊 (CLOS 系列 
期 刊 ， 因此 , 数据 的 全 面 性 存在 一 定 的 欠缺 。 

(3) 在 CiteULike、Mendeley、Figshare 等 在 线 学 
术 性 标签 标注 分 享 平台 中 , 用 户 大 多 数 是 以 英语 为 母 
语 的 研究 者 ， 这 种 偏见 也 与 SCI 收录 的 期 刊 多 为 英文 
期 刊 相 一 致 。 这 样 就 导致 这 些 在 线 使 用 与 分 享 的 用 户 
数据 可 能 单一 ,对 结果 有 一 定 影 响 。 


6 结 语 


高 被 引 论文 并 不 具有 高 的 在 线 使 用 与 分 享 ， 只 有 
部 分 期 刊 的 高 Mendeley 指标 揭示 了 高 影响 力 文献 ， 似 
平 在 线 的 “喜欢 或者“ 分享" 缺乏 权威 性 和 科学 的 可 信 
度 F50， 论 文 的 在 线 使 用 与 分 享 在 揭示 高 影响 力 文献 方 
面具 有 一 定 的 局 限 性 , Altmetrics 并 不 能 替代 传统 的 科 
学 计量 评价 ， 只 是 对 科研 成 果 在 社交 网 络 上 的 影响 力 
或 者 社会 影响 力 的 一 种 传播 计量 。 传 统 的 学 术 的 评价 
(科学 引用 和 同行 评议 ) 显 然 还 有 存在 的 价值 ， 因此， 
构建 一 个 多 维 的 科研 评价 体系 , 包括 Altmetrics 和 传 
统 的 文献 计量 , 综合 全 面 评价 学 术 成 果 ， 势 在 必 行 。 

在 社交 网 络 分 享 科研 成 果 可 能 会 提高 成 果 的 可 见 
度 和 未 来 的 引用 次 数 。 因此, 科研 人 员 抓 住 机 会 , 积 
极 参 与 和 投身 社交 媒体 ， 扩大 科研 成 果 的 可 见 度 和 
传播 5 使 大 众 更 广泛 地 参与 科研 的 全 流程 ,增加 对 
科学 某 些 具体 领域 (如 与 人 类 生存 息息相关 的 气候 变 
化 和 环境 科学 领域 ) 的 关注 。 
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Analyzing Online Usage & Sharing of Highly Cited Papers 


Kuang Denghui 
(Nankai University Library, Tianjin 300071, China) 


Abstract: [Objective] This empirical case study aims to validate the effectiveness of using Altmetrics indicators to 
identify high quality articles. [Methods] First, we retrieved the online usage and sharing data of highly cited papers 
published by the PLOS journals from social platforms (i.e., CiteULike, Mendeley and Figshare). Second, we examined 
relationship between these Altmetrics and SCI citation counts of the target papers. [Results] The correlation coefficient 
between the SCI citation data and the Altmetrics generated by Mendeley was strong (r = 0.376, p = 0.01). Meanwhile, 
the other two correlation coefficients were weaker. The online usage data from Mendeley might help us identify high 
impact literature published by specific journals. [Limitations] This research only investigated a few subjects covered by 
the PLOS serial journals. More research is needed to check the relationship between Altmetrics and citation counts in 
other fields. [Conclusions] Online usages & sharing data from CiteULike, Mendeley and Figshare might not be able to 
effectively identify the high impact literature. 

Keywords: Highly cited papers Online usages Mendeley CiteULike Sharing Figshare 


新 技术 促使 澳大利亚 的 图 书馆 成 为 社区 中 心 


学 界 一 些 新 的 研究 表明 ,地方 图 书馆 正面 临 着 不 断 变化 的 社区 需求 。 由 Civica 公司 和 悉尼 科技 大 学 公共 政策 与 治理 研究 
所 进行 的 题 为 “图 书馆 作为 公共 空间 的 价值 ”的 深入 调查 发 现 : 未 来 的 图 书馆 将 成 为 社区 支持 中 心 。 在 许多 情况 下 ,图 书馆 需 
要 7x24 小 时 开放 。 

题 为 “图 书馆 作为 公共 空间 的 内 在 价值 的 报告 在 Civica 博览 会 上 由 悉尼 科技 大 学 公共 政策 与 治理 研究 所 主任 Roberta 
Ryan 副教授 发 起 。 

该 调查 统计 了 澳大利亚 和 新 西 兰 的 图 书馆 的 管理 者 、 老 员工 ,以 及 地 方 政 府 高 级 管理 人 员 的 意见 。 受 访 者 一 致 认为 侧重 
于 沉默 阅读 和 学 习 的 图 书馆 已 经 过 时 。 

Civica 公司 图 书馆 与 教育 解决 方案 总 监 Simon Jones 说 :“ 这 项 研究 表明 ,图 书馆 不 仅 需 要 改变 , 更 应 该 不 断 寻 找 新 的 方法 

新 的 模式 ， 以 更 好 地 服务 于 社会 需求 。” 
该 调查 指出 ,激进 的 新 方法 ， 如 在 图 书馆 提供 企业 孵化 器 设施 , 将 有 助 于 社区 新 企业 的 诞生 。 只 要 提供 免费 WiFi 和 计算 
机 服务 , 图 书馆 就 可 以 给 潜在 的 企业 家 提供 一 个 他 们 需要 的 基础 条 件 ， 而 这 是 他 们 在 公开 市 场 上 无 法 负担 的 。 

“7x24 小 时 开放 的 图 书馆 在 许多 情况 下 是 无 人 值守 的 , 这 已 经 在 包括 瑞典 在 内 的 几 个 国家 开始 运作 ,这 种 模式 很 可 能 很 
快 就 会 在 澳大利亚 的 一 些 城 市 进行 试用 。”Simon Jones 指出 。 

图 书馆 的 未 来 将 是 一 站 式 的 , 为 社区 提供 失业 援助 、 健 康 咨询 、 社 区 学 习 和 商业 发 展 等 支持 。 
虽然 图 书馆 员 已 经 接受 了 数字 时 代 的 挑战 , 但 他 们 没有 离开 他 们 的 核心 责任 ， 即 ,提供 阅读 图 书 和 学 习 的 机 会 。 然而 ， 
他 们 都 同意 ,在 数字 时 代 ， 有 许多 新 方法 能 为 社区 中 的 更 多 人 提供 资源 。 他 们 认为 ， 提供 阅读 图 书 和 学 习 机 会 的 核心 功能 将 
保持 不 变 , 但 一 系列 新 服务 的 开展 仍 需 围绕 该 核心 功能 。 

超过 77% 的 受 访 者 表示 , 图 书馆 使 用 免费 WiFi 为 读者 提供 一 般 互联 网 使 用 是 现代 图 书馆 的 重要 功能 。 

受 访 者 还 认为 ,图 书馆 如 果 提 供 更 多 基于 社区 的 空间 将 有 助 于 促进 社会 凝聚 力 和 社区 交互 ， 防 止 社 会 扳 立 。 
(编译 自 : https://librarytechnology.org/news/pr.pl?id=21985) 
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